Ejercicio 11
En este problema, se un modelo para predecir si un automóvil determinado obtiene un consumo alto o bajo de combustible basado en el conjunto de datos Auto.
PUNTO A: Cree una variable binaria, mpg01, que contenga un 1 si mpg contiene un valor por encima de su mediana y un 0 si mpg contiene un valor por debajo de su mediana. Puede calcular la mediana usando la función median (). Tenga en cuenta que puede resultarle útil utilizar la función data.frame () para crear un único conjunto de datos que contenga tanto mpg01 como las otras variables automáticas.

PUNTO B: Explore los datos gráficamente para investigar la asociación entre mpg01 y las otras funciones. ¿Cuál de las otras caracterÃsticas parece más útil para predecir mpg01? Los diagramas de dispersión y los diagramas de caja pueden ser herramientas útiles para responder a esta pregunta. Describe tus hallazgos.

PUNTO C: Divida los datos en un conjunto de entrenamiento y un conjunto de prueba.

PUNTO D ,E ,F, G: Realice los modelos de LDA, QDA, Regresión logistica y KNN con varios valores de K en los datos de entrenamiento para predecir mpg01 usando las variables que parecÃan más asociadas con mpg01 en (b). ¿Cuál es el error en las pruebas de los modelos obtenidos?
